1
Avanzando más allá del techo secuencial
AI032Lesson 10
00:00

El fin del 'almuerzo gratis'

Durante décadas, los desarrolladores disfrutaron del "techo secuencial"—una época en la que Escalado de Dennard garantizaba que cada nueva generación de chips trajera velocidades de reloj más rápidas. Pero hemos alcanzado la Pared de potencia. El rendimiento ya no depende de la frecuencia; ahora depende de la concurrencia. Para avanzar, debemos emplear Pensamiento computacional para cerrar la brecha entre los métodos numéricos y los modelos modernos de ejecución paralela.

La tensión entre precisión y rendimiento

Migrar un problema de dominio (como dinámica molecular) desde un host multinúcleo hacia dispositivos CUDA es más que un cambio sintáctico; es un cambio en Descomposición de problemas. Cuando paralelizamos, a menudo cambiamos el orden de las operaciones. Debido a que la aritmética de punto flotante no es asociativa, enfrentamos una trade-off: Precisión de punto flotante frente a exactitud. Un resultado paralelo podría ser matemáticamente válido, pero numéricamente distinto de su antepasado secuencial.

TECHO SECUENCIALLímite de velocidad de relojAUTOPISTA PARALELARendimiento de CUDAPUENTE DEL PENSAMIENTO COMPUTACIONAL
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>